Вообще термин "Монте Карло" (МК) используют для обозначения широкого спектра методов, основанных на повторении случайных выборок. В обучении с подкреплением (RL) методы МК позволяют производить оценку значений непосредственно из опыта: из последовательности состояний (state), действий (action) и вознаграждений (reward
(
Read more... )